大作业 提取年报内容画图分析

利用Excel里的链接生成csv

筛选年报数量前十家公司形成单独的csv

由于新能源年报较少这里只有8家公司

利用csv里的链接匹配其第二层链接下载年报

定义 get_PDF_url 函数对csv链接进行匹配

导入最终csv并将年报下载

对年报数据进行处理

导入模块以及PDF

年报数据获取

定义getText函数对年报进行读入

定义get_section和get_content 函数进行目标表格的读取

年报数据形成表格

由于函数获取的是表格 这里使用循环对获取的年报主要部分行程表格后形成

年报数据的导出

导入csv进行画图分析

利用dataframe的库对每个公司年度销售收入画图·

每个年度的八家公司进行画图